联通云 coding plan 的 deepseek v4 系列被强行关闭思考模式了,用户无法强行开启
用了一堆的参数覆盖,没有任何的思考输出: { "reasoning_effort": "max", "reasoning": "true", "enable_thinking":
deepseek v4 - 钛刻 - 科技风向旗 - 深度刻画技术趋势,引领数字未来 - 第3页 - 钛刻科技 | TCTI.cn - 钛刻 (TCTI.cn) 为您提供最前沿的硬核科技资讯、深度评测和未来技术趋势分析。
共 559 篇相关文章 · 第 3 / 28 页
用了一堆的参数覆盖,没有任何的思考输出: { "reasoning_effort": "max", "reasoning": "true", "enable_thinking":
用了一堆的参数覆盖,没有任何的思考输出: { "reasoning_effort": "max", "reasoning": "true", "enable_thinking":
用了一堆的参数覆盖,没有任何的思考输出: { "reasoning_effort": "max", "reasoning": "true", "enable_thinking":
用了一堆的参数覆盖,没有任何的思考输出: { "reasoning_effort": "max", "reasoning": "true", "enable_thinking":
在沉浸式翻译插件中使用 API 形式调用 DeepSeek V4 Flash 模型时,如何设置关闭该模型的 Thinking 功能? 另外,DeepSeek-V4-Flash 模型的 Thinking 功能如果不显式关闭的话,是否会默认启用,从而导致在进行翻译时多消耗 Token
OAI 的 Pro Plus 都暴毙了 ZP 的 Plan 也用完贤者了 翻找还有哪些能用的发现 Blaze 上新了不少模型 倍率感人,不知是否满血 兴冲冲接入配置 推荐用法 (点击了解更多详细信息) 发现他们家疑似非中转平台而是自己部署的,速度慢的惊人 啊?你说怎么没有看到 v
佬友们好,本人是通信工程大一学生,目前用的ChatGPT Plus + 京东云Coding Plan ,感觉京东云的Coding Plan 性价比不是很高,也没有GLM 5.1或者 Deepseek V 4,在考虑要不要把京东云的Coding Plan 换成 Deepseek 官
DeepSeek V4发布已经一周时间了,期间三次降价或者优惠,还发了视觉大模型,本代大模型布局基本完成。相比去年的DeepSeek R1,这次的DeepSeek V4发布之后争议更多,主要是没有之前R1那种技术上领先的感觉了,各种AI榜单上实际上也落后于美国公司开发的AI大模型
好奇对比效果,这俩现在的定位是差不多的吧,都是opus4.7和gpt5.5外的次优选择 7 个帖子 - 7 位参与者 阅读完整话题
之前一直用antigravity和codex,今天充了deepseek想试一下,结果显示不能识别图片 13 个帖子 - 10 位参与者 阅读完整话题
接了个2api,调了半天 toolcall 使能还以为是自己瞎改 ds2api 导致的奇妙问题,结果上号一看气笑了,模型在自己意淫 toolcall 结果 10 个帖子 - 7 位参与者 阅读完整话题
claude code 开发者模式接入deepseek v4 list/model 可以拿到模型,但对话报错,有大佬知道为什么? 1 个帖子 - 1 位参与者 阅读完整话题
速度快而且非常便宜,梁圣继续给我冲,期待多模态的版本开放,如果后训练再侧重coding领域就更舒服了 3 个帖子 - 3 位参与者 阅读完整话题
这几天一直在刷 DeepSeek V4,各种测试加上各种日常使用一起上 不知不觉已经烧 65.5M tokens 了 有没有人更猛的?来晒一下用量,顺便说说都拿来干嘛用 22 个帖子 - 15 位参与者 阅读完整话题
首先我们分一下类: 结构化报告类(商业/技术 分析/研究/调研报告) 技术文档类(用户手册、项目文档) 营销/职场实用文(文案、纪要、社交媒体) 教育/知识转化类(知识点讲解、文件转笔记、科普文章) 创意/叙事类(小说) 深度长文(深度博客、公众号文章、观点输出) 其他 我个人尝
标题有点开玩笑了别介意。其实是最后一条user消息的最后插入system prompt可以极大概率影响思维链,导致看上去就是完美扮演了system prompt该有的作用。不过遵从概率并不是百分之百,而且最好是始终遵从系统指令放在最后的格式,如果中途崩坏有可能永远都救不回来了。
做个可以自由旋转的魔方的前端页面历经5轮对话,功能才能勉强实现。 第6轮对话让他模型更精致点,结果就功能失常,还在检修中 win 版 opencode ============================================= 思考5分钟,问题没有解决,有的难受。
IT之家 4 月 29 日消息,华为官方今日宣布,鸿蒙“龙虾”小艺 Claw 迎来重磅更新, 上线“自进化”能力 。在 11.6.3.300 新版本上线后,对小艺提出“记住这种风格”、“以后都用这种格式”、“永远都不要犯这种错”这类要求时, 它会识别并学习长期偏好,可减少重复沟通
在使用cherry studio调用DeepSeek官方API时发现的,模型会频繁出现忽略输入内容的情况。 具体表现为,当单次输入的prompt内容较长时,比如超过10000tokens,大模型的输出结果就明显看出来,它忽略了前5000个输入token,实际使用过程中甚至出现过忽
在一个大型仓库中 使用 opencode 对 pro 以及 flash 分别让其根据代码库分析三个问题。pro 回答更好,更符合人的预期。flash 稍差一些,但是基本也能够分析到,只是结论总结的不如 pro,但是速度更快。 本次测试主要关注的价格: 价格方面 6 轮问答 多次检